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【摘要 】 基 于 2018 年 1 月 1 日 至 2019 年 12 月 31 日 东方 财富 网 深 证 成 指 股吧 的 评论 数 
据 ， 本 文通 过 使 用 深度 学 习 BERT 模型 提取 了 其 中 蕴含 的 投资 者 情绪 ， 并 应 用 TVP-VAR 
模型 对 投资 情绪 、 股 市 流动 性 以 及 波动 性 三 者 之 间 的 时 变 联 动 关系 进行 了 研究 。 实 验 结 
果 表 明 , 投资 者 情绪 对 股市 流动 性 和 波动 性 的 冲击 更 为 强烈 ， 而 反 向 的 影响 虽然 相对 较 
小 ， 但 其 随 股 市 状态 变化 更 为 显著 。 此 外 ， 在 所 有 情况 下 ， 短 期 的 响应 都 比 中 长 期 更 显 
著 ， 且 影响 具有 非 对 称 性 ， 市 场 下 行 时 期 的 冲击 更 为 强烈 。 
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[Abstract] Based on the review data of Shenzhen stock index BBS from January 1, 2018 to 
December 31, 2019, this paper extracts the investor sentiment contained in it by using the 
deep learning BERT model, and studies the time-varying linkage relationship among 
investment sentiment, stock market liquidity and volatility by using TVP-VAR model. The 
experimental results show that investor sentiment has a stronger impact on the liquidity and 
volatility of the stock market, while the reverse Impact is relatively small, but it changes more 
significantly with the state of the stock market. In addition, 1n all cases, the short-term 
response 1s more significant than that im the medium and long term, and the impact is 
asymmetric, and the impact in the market downturn is stronger. 
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一 、 引言 

股市 的 相对 稳定 是 股市 发 展 壮 大 的 基础 ， 它 有 利于 国内 外 投资 者 的 进入 ， 也 有 利于 
避免 金融 危机 的 爆发 。 股 市 的 异常 波动 将 会 使 大 部 分 投资 者 对 市 场 失 去 信心 ， 也 会 使 作 
为 资产 配置 指标 的 股价 信号 失真 ， 进 而 增加 整个 金融 体系 的 系统 性 风险 。 相 对 于 欧美 国 
家 成 熟 的 股市 ， 中 国 股市 波动 性 较 大 。2014 年 至 2015 年 上 证 综 指 暴涨 暴跌 事件 引发 了 
股票 市 场 和 投资 者 的 反思 ， 其 成 因 可 以 从 行为 金融 和 分 形 市 场 理论 两 个 角度 来 解释 ， 前 
者 突出 投资 者 的 行为 和 情绪 的 重要 影响 ， 后 者 强调 市 场 流动 性 因素 。 由 此 可 见 ， 投 资 者 
情绪 和 市 场 流动 性 的 动态 变化 已 经 成 为 市 场 波动 性 的 重要 影响 因素 。 随 着 股票 交易 的 互 
联网 化 和 大 众 化 ， 对 投资 者 情绪 、 股 票 市 场 流动 性 及 波动 性 间 互 动机 制 进行 探究 的 重要 
性 日 益 凸 显 。 

本 文 预期 的 边际 贡献 为 : (1) 对 当前 计算 机 文本 处 理 领 域 最 前 沿 的 深度 学 习 模 型 之 
一 一 一 BERT 预 训练 模型 进行 微调 ， 实 现 一 个 更 适合 更 可 靠 判 断 中 文 投资 者 文本 情绪 的 
BERT 模型 ， 并 将 其 开放 开源 以 供 后 续 研究 者 共同 使 用 和 改进 ;(2) 当前 学 界 中 较 多 文献 
探究 投资 者 情绪 与 股票 市 场 流动 性 、 股 票 市 场 波动 性 其 中 一 者 的 影响 关系 ， 但 较 少 文献 
研究 三 者 之 间 的 联动 关系 ， 本 文通 过 使 用 TVP-VAR 模型 对 其 进行 研究 ， 以 期 进一步 丰富 
学 界 相关 领域 的 研究 。 


过 


二 、 文献 综述 

近年 来 ， 随 着 股票 市 场 交易 的 互联 网 化 和 大 众 化 ， 探 究 投资 者 情绪 对 市 场 的 影响 机 
制 在 行为 金融 研究 领域 的 重要 性 日 益 凸 显 。 通 过 阅读 文献 综述 ， 本 文 将 项 目的 研究 工作 
分 成 了 探究 “投资 者 情绪 测度 ”以 及 “投资 者 情绪 与 股票 市 场 的 联动 关系 ”的 两 部 分 ， 
并 基于 此 进一步 细 化 了 文献 阅读 和 研究 学 习 的 方向 。 

(一 ) 投资 者 情绪 

直接 调查 法 需要 耗费 研究 者 大 量 的 时 间 精 力 ， 且 样本 容量 有 限 偏 误 较 大 ， 在 近期 的 
研究 中 己 较 少 被 使 用 。 市 场 代理 指标 法 常 通过 选择 封闭 基金 折价 、 换 手 率 等 代理 变量 并 
使 用 主 成 分 分 析 法 构建 投资 者 情绪 代理 指标 。 该 方法 较 易 实现 且 研 究 效 果 较 为 显著 ， 因 
此 仍 被 广泛 使 用 。 但 它 也 存在 只 能 间接 反映 投资 者 情绪 的 缺陷 。 而 词典 法 则 是 通过 将 金 
融 文 本 中 出 现 的 情绪 词 与 词典 进行 对 照 进 而 得 到 加 权 的 投资 者 情绪 指标 。 该 方法 能 直接 
反映 投资 者 情绪 ， 极 大 地 促进 了 国内 外 对 金融 文本 分 析 的 研究 ， 但 也 存在 情绪 指标 受 词 
典 质量 的 影响 较 大 的 问题 ， 且 构建 词典 的 工作 量 比较 繁琐 。 随 着 计算 机 算 力 的 提升 和 自 
然 语言 处 理 领 域 的 算法 不 断 更 新 ， 许 多 学 者 开始 借用 支持 向 量 机 (SVM)、 弟 归 神 经 网 络 
CRNN) 和 长 短期 记忆 单元 (LSTM) 等 模型 算法 并 利用 机 器 学 习 的 方法 直接 提取 金融 文 
本 中 的 投资 者 情绪 ， 并 构建 指标 ， 此 类 研究 随 着 机 器 学 习 模型 算法 的 改进 不 断 提 高 准确 
率 。Huicheng Liu 利用 双向 LSTM 对 新 闻 文本 进行 编码 并 搜捕 上 下 文 情绪 信号 特征 ; Yao 
Qin 利用 非 线 性 自 回归 模型 ， 构 建 出 一 种 基于 双 阶 段 递归 神经 网 络 时 间 序 列 的 预测 方法 
来 研究 投资 者 情绪 。 目 前 ， 机 器 学 习 法 是 投资 者 情绪 测度 领域 最 前 沿 的 方向 ， 因 此 本 文 
考虑 采用 机 器 学 习 的 方法 研究 投资 情绪 。 
情感 分 类 是 自然 语言 处 理 任务 中 的 一 个 子 任务 ， 其 本 质 上 是 对 带 有 情感 色彩 的 主观 
性 文本 进行 分 析 、 处 理 、 归 纳 和 推理 的 过 程 ， 而 本 文 研究 的 是 对 股吧 情绪 的 分 析 处 理 ， 
情感 分 类 有 利于 对 股市 舆情 监测 进行 合理 检测 。 

随 着 计算 机 硬件 的 发 展 , 一 种 网 络 结构 更 深 、 更 复杂 的 深度 学 习 模 型 一 一 BERT 由 此 
而 被 设计 出 来 。 研 究 发 现 BERT 更 多 地 用 于 媒体 、 政 治 评论 研究 ， 例 如 Guoshuai Zhang 
等 (2020) 利用 BERT 语言 模型 分 析 《 纽 约 时 报 》 发 布 的 新 闻 ， 预 测 美国 未 来 短期 内 的 
政策 变化 ， Jiaqi Hou 等 (2020) 结合 transformer 的 双向 编码 器 的 BERT 模型 ， 提 出 一 
种 新 的 BERT-att， 并 证 明 这 种 模型 比 领先 的 基线 模型 更 有 效 , 可 用 于 安全 风险 评估 等 领 
域 。 然 而 在 金融 研究 领域 ， 仍 鲜 有 学 者 在 研究 中 使 用 BERT 模型 ， 也 较 少 有 学 者 将 其 调 
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试 好 后 的 可 以 直接 使 用 的 情绪 判断 机 器 模型 进行 开源 , 研究 希望 能 为 本 领域 填补 上 这 方 
面 的 差距 和 空白 ,以 便 未 来 的 研究 能 在 该 方向 上 持续 推进 和 优化 ， 本 文 的 研究 对 当前 计 
算 机 文本 处 理 领域 最 前 沿 的 深度 学 习 模 型 之 一 一 一 BERT 预 训练 模型 进行 微调 , 实现 一 个 
更 适合 更 可 靠 判 断 中 文 投资 者 文本 情绪 BERT 模型 。 


(二 ) 市 场 流动 性 

股市 流动 性 是 指 股市 迅速 地 、 低 成 本 地 执行 大 量 交 易 并 且 不 会 造成 价格 大 幅 变 化 的 
现象 。 流 动 性 包括 几 个 方面 的 内 容 : 一 是 交易 的 即时 性 ， 二 是 交易 的 低 成 本 性 ， 三 是 可 
交易 的 股票 数量 巨大 ; 四 是 价格 偏 低 程 度 小 。 目 前 研究 中 用 的 的 流动 性 指标 众多 ， 可 以 
根据 研究 方向 的 需要 构建 不 同 的 流动 性 指标 。 杨 朝 军 (2008) 借鉴 Amivest 流动 性 比率 与 
Hui-Heubel 流动 性 比率 思想 的 基础 上 , 提出 新 的 流动 性 指标 ， 曾 志 坚 和 罗 长 青 (2008) 以 
换 手 率 为 流动 性 变量 ， 利 用 一 年 上 交 所 数据 研究 了 两 个 市 场 流 动 性 之 间 的 联动 关系 。 
研究 发 现 股票 市 场 和 债券 市 场 月 度 流 动 性 之 间 不 存在 领先 滞后 关系 ; 王 黄田 等 (2010) 
对 股票 市 场 和 债券 市 场 的 流动 性 溢出 效应 进行 研究 ,构建 出 基于 价格 影响 的 流动 性 衡量 
方法 的 流动 性 指标 ; 韩 金 晓 等 (2017) 用 Crowin 和 Schultz (2012) 价差 类 指标 可 以 有 
效 地 度量 中 国 股票 市 场 流动 性 。 在 股票 市 场 ， 换 手 率 是 最 简单 的 流动 性 指标 。 


(三 ) 市 场 波动 性 

股票 市 场 波动 性 是 指 由 于 经 济 因素 、 政 策 因 素 和 市 场 参 与 者 自身 因素 的 变化 引起 对 
市 场 预 期 的 变化 而 产生 的 股票 价格 的 变化 。 股 票 市 场 波动 受 基本 面 、 资 金 面 、 投 资 者 情 
绪 等 多 方面 因素 的 影响 。 对 于 金融 市 场 来 说 ， 波 动 性 是 非常 重要 的 特征 之 一 ， 它 反映 金 
融资 产 回 报 随 之 间 的 变化 。 对 于 波动 性 的 测算 方法 ， 已 有 文献 中 较为 普遍 的 方法 有 : 收 
益 率 的 方差 或 标准 差 、 收 益 率 的 条 件 方差 、 震 荡 幅 度 等 。Engle 〈1982) 的 研究 中 将 方 
差 和 条 件 方差 进行 区 分 ， 建 立 了 ARCH 模型 ， 开 创 了 波动 性 研究 的 新 思路 。Bollerslev 
《1896) 在 此 基础 上 提出 了 GARCH 模型 。 黄 海南 和 钟 伟 《〈《2007) 提出 运用 GARCH 类 模型 
来 预测 上 证 指数 的 收益 波动 率 。 戴 去 (2018) 利用 ARMA-GARCH 模型 族 对 ST 类 股票 收益 
率 进 行 实证 分 析 。 现 有 文献 对 于 股票 市 场 波动 性 研究 方面 揭示 了 证 券 价 格 波动 的 聚集 性 、 
持续 性 和 非 对 称 性 ， 验 证 了 ARCH 族 模 型 在 证 券 价 格 波动 建 模 中 的 适用 性 。 目 前 国内 外 
学 者 提出 的 多 种 模型 从 不 同方 面 考量 股市 波动 性 ， 可 以 根据 研究 所 需 进 行 选择 ， 基 于 实 


际 情况 ， 本 文 参 考 国泰 安 数据 库 中 的 已 实现 波动 率 来 构建 股市 波动 性 指标 。 

(四 ) 投资 者 情绪 与 股票 市 场 流动 性 、 股 票 市 场 波动 性 相关 研究 

在 投资 者 情绪 对 流动 性 的 影响 方面 ，Chen 等 (2009) 研究 了 投资 者 情绪 、 市 场 流动 
性 和 投资 者 交易 行为 之 间 的 联系 ， 结 果 发 现 投资 者 的 情绪 倾向 于 悲观 时 ， 更 多 的 投资 者 
会 选择 卖 出 ,减少 了 市 场 的 净 买 入 量 ， 进 而 降低 了 市 场 流动 性 ， 同 时 个 人 投资 者 对 于 情 
绪 变 化 的 反应 程度 高 于 机 构 投资 者 。 李 春 红 和 喜光 裕 〈2011) 运用 格 兰 杰 因果 关系 发 现 
投资 者 情绪 是 股票 流动 性 的 格 兰 杰 原因 , 投资 者 情绪 通过 影响 股票 流动 性 进而 间接 影响 
股票 市 场 的 资本 化 率 和 经 济 增长 水 平 。 王 丹 枫 和 梁 丹 2012) 发 现 投 资 者 情绪 变化 会 增 
加 市 场 流 动 性 ， 对 股票 预期 收益 的 流动 性 溢价 的 影响 也 变 得 显著 。 刘 晓 星 等 〈2016) 发 
现 投资 者 情绪 会 正 向 影响 市 场 流 动 性 ， 且 投资 者 对 于 股市 信息 的 认 知 能 力 越 高 时 ， 股 市 
流动 性 相对 减弱 。 此 外 ， 研 究 发 现 投资 者 的 积极 情绪 和 消极 情绪 对 于 股市 流动 性 的 影响 
程度 存在 差异 。 杨 晓 兰 等 〈2016) 通过 本 地 偏好 、 投 资 者 情绪 对 股市 的 影响 研究 ， 发 现 
本 地 关注 对 股票 交易 量 的 正 向 影响 在 积极 情绪 下 比 消极 情绪 下 的 影响 程度 更 大 。 石 广 平 
等 (2016) 利用 TVP-SV-SVAR 模型 分 析 投 资 者 情绪 、 市 场 流动 性 对 股市 泡沫 的 影响 ， 发 
现 投资 者 情绪 对 股市 流动 性 的 影响 , 且 在 牛市 中 乐观 情绪 的 影响 比 在 熊市 中 悲观 情绪 的 
影响 更 加 显著 。 上 述 文献 从 不 同 视角 研究 了 投资 者 情绪 对 股市 流动 性 的 影响 ， 并 在 一 定 
程度 上 发 现 了 不 同类 型 的 情绪 对 于 股市 的 差异 化 影响 以 及 在 不 同时 期 下 的 差异 化 表现 。 

在 投资 者 情绪 对 股票 市 场 波动 的 影响 方面 ，Lee 等 (2002) 发 现 投资 者 情绪 对 股票 
场 波动 性 有 显著 影响 ， 其 中 积极 情绪 会 减弱 市 场 波动 ， 消 极 情绪 会 增 大 市 场 波 动 。 张 宗 
新 和 王 海 亮 (2013) 运用 主 成 分 分 析 法 构建 投资 者 情绪 指数 ， 分 析 投 资 者 情绪 与 股市 波 
动 之 间 的 关系 ， 发 现 投资 者 情绪 对 市 场 收 益 率 和 波动 率 存 在 显著 的 正面 影响 ， 情 绪 水 平 
越 高 ， 股 市 收益 率 变化 越 大 ， 股 价 偏离 内 在 价值 越 远 ， 股 市 波动 越 大 。 胡 昌 生 和 池 阳 春 
《2013) 发 现 理 性 投资 者 和 非 理性 投资 者 都 是 市 场 波 动 的 制造 者 ， 投 资 者 的 情绪 会 使 市 
场 偏离 理性 框架 ， 导 致 异常 波动 。 陆 剑 清和 陈 明 珠 (2013) 提出 “预期 情绪 溢出 效应 ” 
假说 ， 认 为 微观 层面 的 投资 者 的 心理 预期 激发 了 羊 群 效应 ， 诱 发 了 宏观 层面 的 “股市 同 
频 共 振 效应 ”， 加 剧 了 股市 波动 。 巴 曙 松 (2016) 指出 融资 融 券 将 助长 投资 者 情绪 ， 并 
对 市 场 波动 性 具有 加 剧 效应 。 上 述 文献 从 不 同 角 度 出 发 , 证实 了 投资 者 情绪 是 股市 系统 
性 风险 因素 之 一 ， 也 是 影响 股市 收益 波动 的 重要 因素 。 


三 、 数据 处 理 与 模型 构建 

(一 ) 数据 的 选取 

考虑 研究 对 象 的 选取 , 需要 对 整个 A 股市 场 有 一 个 较 好 的 概括 ， 能 够 全 方位 的 反映 
投资 者 情绪 的 实际 状况 ， 本 文选 取 东 方 财富 网 股吧 作为 文本 数据 来 源 ， 选 取 已 实现 波动 
率 (RV.) 、 换 手 率 (Turne) 作为 变量 来 研究 投资 者 情绪 的 影响 。 

1. 文本 数据 的 选取 

本 文人 息 取 东方 财富 网 ?股吧 2018 年 1 月 1 日 至 2019 年 12 月 31 日 的 股吧 数据 ， 横 
同 对 比 多 个 个 股 以 及 指数 股吧 数据 ， 最 终 选 择 深 证 成 指 的 股吧 。 相 比 上 证 综 指 以 及 其 他 
指数 股吧 数据 ， 深 证 成 指 股吧 有 具有 数据 量 合适 、 浏 览 人 数 多 、 代 表 性 强 等 特征 。 其 次 ， 
深 证 成 指 包含 了 在 深交 所 上 市 的 具有 一 定 规模 的 500 支 优 质 公司 股 , 涵盖 了 各 个 行业 的 
数据 。 因 此 深 证 成 指 能 很 好 的 反应 股票 市 场 的 情况 。 在 文本 处 理 上 , 遵循 文本 分 析 标 准 ， 


删除 了 重复 数据 、 数 据 中 的 表格 、HTML 标签 等 非 文 本 项 目 。 
表 1 2018 年 1 月 1 日 深 证 成 指 部 分 成 分 股 


排名 代码 简称 权重 (%) 总 股本 (万 亿 ) 
1 000333. SZ 美的 集团 3. 63 65. 61 

2 000651. SZ 格力 电器 3.10 60. 16 

3 000858. SZ 五 粮 液 2. 20 37. 96 

4 000725. SZ 京东 方 A 2. 19 347. 98 
5 000002. SZ 万 科 A 1. 88 110. 39 
注 : 数据 来 源 同 花 顺 iFind 数据 库 。 


表 2 每 日 评论 统计 汇总 信息 


时 间 评论 阅读 量 评论 数 
不 可 否认 ,今日 又 是 涨幅 巨大 股票 忆 抛 机 会 。 必 须 用 平 
2019-1-2 2115 0 
静心 态 面 对 涨 涨 跌 跌 
2019-1-2 北向 外 资 流入 A 股 ， 净 流入 逾 3100 亿 元 ， 利 好 。 1159 2 
股市 内 外 环境 发 生根 本 改变 ， 别 用 陈旧 熊市 眼光 看 待 股 
2019-1-2 921 0 


市 ， 股 市 大 开放 股价 必须 步 步 上 台阶 
归于 股票 市 值 是 不 断 变动 的 ， 因 此 成 分 股 也 是 不 断 变 化 的 , 表 1 是 2018 年 1 


和 


全 


2 根据 iResearch 2018 年 的 一 份 分 析 报 告 指出 ， 东 方 财富 网 是 中 国 顶 级 金融 网 站 。 每 月 有 效 浏览 时 间 为 7800 万 小 时 ， 占 市 场 份额 
的 45%， 高 于 前 10 家 公司 中 其 余 9 家 公司 的 总 和 。 
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月 1 日 深 说 


成 指 部 分 成 分 股 ， 但 在 本 文 研 究 期 间 内 ， 成 分 股 变化 不 大 ， 因 此 可 以 不 考虑 


成 分 股 变化 带 来 的 影响 。 此 外 ， 我 们 对 每 日 股吧 疏 取 的 信息 包括 时 间 、 评 论 内 容 、 阅 读 
数 和 评论 数 等 内 容 ， 如 表 2 所 示 。 

从 表 3 所 得 到 的 统计 信息 可 以 看 出 , 每 天 平均 评论 标题 长 度 为 62.7 个 字符 , 且 内 容 
时 右 偏 分 布 。 与 传统 的 (相对 较 短 的 ) 评论 不 同 的 是 ， 股 吧 数 据 中 一 些 字数 较 多 的 股评 
通常 是 从 其 他 来 源 复制 和 粘贴 而 来 的 ， 如 新 闻 报 道 和 分 析 报 告 。 在 这 里 我 们 使 用 简单 的 
处 理 来 消除 这 些 潜 在 的 潜在 影响 离 群 值 ， 仅 保留 少 于 150 个 汉字 的 股评 。 此 外 考虑 到 


YH 


每 日 评论 数 参差 不 齐 以 及 考虑 不 同 阅读 量 对 结果 的 影响 ， 我 们 选择 了 按 阅 读 量 排序 ， 由 


高 到 低 每 日 选取 了 前 50 条 数据 进行 研究 。 


表 3 经 预 处 理 的 股吧 评论 文本 数据 的 基本 统计 描述 
Mean S.D Skewness Min Max Count 


数据 长 度 〈 字 符 ) 62.6754 169.0293 7.9438 2 2921 39784 


注 : 此 表 为 每 天 评论 长 度 的 汇总 统计 信息 。 变 量 的 样本 均值 、 标 准 差 (S.D.， 、 最 大 最 小 数 和 评论 总 数 。 


该 样本 包含 2018 年 1 月 1 日 至 2019 年 12 月 31 日 样本 期 内 深 证 成 指 股吧 评论 数据 。 


2. 


股票 交易 数据 的 选取 


本 文选 取 深 证 成 指 作 为 研究 对 象 ， 借 助 其 每 日 交易 行情 指数 进行 研究 ， 包 括 当 天 的 总 市 
值 、 流 通 市 值 、 总 股本 、 流 通 股本 、 换 手 紊 、 市 僵 率 、 市 净 率 额 等 数据 。 本 文通 过 开源 
的 Python 数据 API 一 一 Tushare 获取 ， 返 回 的 结果 为 Pandas.DataFrame 数据 类 型 。 表 4 


股市 换 手 率 


股市 波动 率 


2018-2019 年 各 指标 的 基本 统计 描述 


Mean S.D Skewness Min Max 
(%) 1.2565 0.5268 2.3546 0.66 3.99 
(%) 1.1936 1.0730 3.6074 0.21 12.02 


由 表 4 可 知 ， 股 市 波动 性 与 换 手 率 平均 值 在 1.2% 左 右 ， 且 二 者 均 呈 现 右 侦 分 布 ， 


其 中 股市 波动 率 较 大 ， 最 大 最 小 值 之 间 相 差 约 10% 可 见 波动 较为 剧烈 。 


(二 ) 模型 构建 

1. 基于 金融 语 料 的 深度 学 习 模型 设计 

深度 学 习 时 代 中 的 NLP (自然 语言 处 理 ) 预 训 练 工作 广泛 使 用 词 嵌入 〈Word 
Embedding) ， 使 用 深度 学 习 模 型 进行 训练 的 时 候 ， 会 将 所 训练 的 次 转化 为 词 向 量 作为 
神经 网 络 的 输入 层 ， 而 在 深度 学 习 模型 训练 的 过 程 中 ， 训 练 结果 的 好 坏 水 平 很 大 程度 取 
决 于 训练 集 的 大 小 ， 较 大 的 训练 集 可 以 训练 出 较 好 的 词 向 量 ， 目 前 在 自然 语言 处 理 领 域 
绝 大 部 分 的 任务 模型 都 会 采用 训练 好 的 词 向 量 。 在 词 向 量 的 训练 过 程 中 ， 词 向 量 忽略 了 
上 下 文 的 表意 ， 当 词汇 出 现 一 词 多 义 的 情况 ， 往 往 对 应 的 是 相同 的 词 向 量 。 因 此 ，2018 
年 Devlin 等 人 (2019) 提出 预 训练 语言 模型 BERT， 问 易 11 个 NLP 任务 的 榜 单 ， 是 
NLP 领域 前 进 的 一 大 步 。BERT 模型 的 结构 如 图 1 所 示 ， 其 中 Ei,E2,…,EN 是 模型 的 输 
入 字符 ， 输 入 字符 通过 双向 的 Transformer 特征 提取 器 获取 文本 特征 ， 输 入 字符 训练 后 
输出 相应 的 向 量 Ti,Ty,.….,TN。 


图 1 BERT 模型 结构 


Input | (cLs] | my | dog | is || cute | [SEP] | he || likes | play | ## 介 img | [SEP] 
Token 
Ercangs [Ba] em |[ eo) 6 | [eo || so | | [eo 


二 中 中 十 十 中 十 十 中 二 中 
grein [Ee le le ls ls jie lls |le ll es, | LE 
Embeddings B 

中 中 中 中 中 守 中 中 中 中 中 
Position 
Exonos [Ele, |[e,|[e, Le] Le le ls, 


图 2 BERT 模型 的 训练 方式 

如 图 2 所 示 ，BERT 作为 一 个 所 有 层 都 能 够 结合 上 下 文 语义 进行 训练 的 模型 ， 其 输 
入 由 字 租 入 (Token Embeddings) 、 段 柑 入 (Segment Embeddings) 以 及 位 置 嵌 入 (Position 
Embeddings) 三 个 向 量 组 成 ， 与 此 同时 ，BERT 采用 的 是 MLM 模型 

(遮盖 语言 模型 ) ，MLM 通过 遮盖 〈Mask) 一 部 分 字 ， 类 似 填 空 ， 然 后 去 预测 被 遮盖 
的 模型 ， 通 过 迭代 来 达到 上 下 文 训练 的 目的 。 

BERT 本 质 上 是 两 段 式 NLP 模型 。 第 一 个 阶段 叫做 :Pre-training〔( 预 训练 ) ， 利 用 
现 有 无 标记 的 语 料 训练 一 个 语言 模型 。 为 了 提高 在 预测 中 的 准确 率 这 里 采用 哈工大 讯 飞 
联合 实验 室 发 布 基于 全 词 覆 盖 (Whole Word Masking,，wwm) 的 中 文 BERT 预 训练 模型 
Chinese-BERT-wwm 作为 预 训练 模型 。BERT 在 完成 预 训练 后 ， 可 将 其 用 于 金融 实体 情 
感 识别 的 任务 ， 在 情感 分 析 中 将 作为 下 一 网 络 的 输出 。 根 据 金 融 文 本 的 特殊 性 ， 在 本 地 
使 用 GPU 将 带 情感 标注 的 金融 文本 进行 第 二 阶段 Fine-tuning〔 微 调 ) ， 就 可 以 训练 出 
在 金融 等 特定 领域 精度 更 高 的 模型 。 

(1) 模型 训练 

本 文 模型 选用 工大 讯 飞 联合 实验 室 发 布 的 
chinese roberta wwm large ext L-24 H-1024 A-16 (24-layer, 1024-hidden, 16-heads) 预 
训练 模型 ， 采 用 了 24 层 Transformer， 其 隐 层 维度 为 1024， 多 头 注 意 力 参数 为 16， 参 数 
模型 总 大 小 为 330MB 。 模型 训练 方面 批 次 大 小 (batch size) 为 16, 学 习 率 (learning rate) 
为 2e-5， 序 列 最 大 长 度 (max seq length) 为 128。 本 文 使 用 三 分 类 对 情绪 进行 标注 ，0 
表示 负 问 情绪 、1 表示 中 性 情绪 、2 表示 正 向 情绪 ,在 所 怜 取 的 2018 年 1 月 1 日 至 2019 
年 12 月 30 日 的 数据 中 ， 随 机 选取 4000 条 数据 ， 进 行人 工 情绪 的 标注 ， 并 对 所 标注 的 
数据 按 8:2 的 比例 划分 训练 集 及 测试 集 ， 进 行 训练 。 如 表 5 所 示 ， 处 理 的 数据 包括 情绪 

CSentiment) 0 代表 消极 ，1 代表 中 性 ，2 代表 积极 ，Positive_Pro 指 文 本 属于 积极 情绪 
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的 概率 ，Negtive_Pro 表示 属于 消极 情绪 的 概率 。 


表 5 部 分 样 例 数据 


Date Context Sentiment Positive Pro Negtive Pro 
10 年 一 次 的 财富 翻 倍 机 会 ， 你 想 实 

2018-12-21 ” 现 财富 自由 吗 ? 现在 抄底 让 你 实现 2 0. 99148 0. 00852046 

梦想 [大 笑 ][ 牛 ] 

上 联 ，[ 牛 ] 借 东 墙 补 西 墙 ， 年 年 没 

2018-12-21 钱 。[ 牛 ] 下联 ，[ 牛 ] 借 新 帐 还 旧账 ， 0 0. 0499047 0. 950095 

年 年 亏损 。 
2018-12-21 A 股 离 完 重 有 多 远 ? 0 0. 042031 0. 957969 


(2) 基于 股评 的 投资 者 情绪 指标 
借鉴 Antweiler 和 Frank(2004) 提 出 的 基于 股吧 帖子 分 类 构建 看 涨 指标 的 方法 , 即 : 


式 (1) 中 ME 


pos eg 


ee 


t 


Sentt = 


pos 
t 


M, +M 


二 Biept) WiXf 表示 类 型 为 ce{posyneu,neg} 的 消息 在 一 段 时 间 D(t) 内 


的 加 权 数 量 之 和 其 中 pos 代表 积极 情绪 ，neg 代表 消极 情绪 ，neu 代表 中 性 情绪 xf 是 指 


示 变 量 ， 如 果 消 息 属于 某 种 类 型 6， 
时 ，ME 就 等 于 D(t) 时 段 内 类 型 为 c 的 消息 总 量 ， 


其 值 为 1， 否 则 为 0; 特别 地 ， 当 权重 全 部 等 于 1 


股评 情绪 指标 Sentt， 介 于 -1 和 1 之 


间 ， 表 达 了 投资 者 们 相对 看 涨 的 程度 ， 该 指标 与 帖子 总 数量 无 关 。 由 图 3 及 表 6 可 以 


看 出 情绪 以 负 疝 居多 ， 


时 间 (T) 
图 3 情绪 分 布 散 点 图 
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负 向 情绪 在 2018 年 为 集中 ， 这 与 2018 年 单 边 下 行 趋势 有 关 。 


四 、 实证 分 析 
(一 ) 平稳 性 检验 
首先 对 投资 者 情绪 (Sente)、 已 实现 波动 率 (RV.》 以 及 换 手 率 (Turn) 这 三 项 指 
标 进行 平稳 性 检验 。 实 验 结果 表明 ， 在 1% 的 显著 性 水 平 下 ， 投 资 者 情绪 (Sent) 和 已 


实现 波动 率 〔RV.) 序列 为 零 阶 竺 整 ， 而 换 手 率 《Turns)〉 序列 为 一 阶 单 整 。 
表 6 变量 平稳 性 检验 结果 汇总 表 


检验 形式 (C, 了 ,站 t 统计 量 p 值 
Sentt (1,0,1) 一 10.89045 0.0000*** 
RV (1,0,2) —6.132106 0.0000*** 
dTurnt (1,0,4) 一 14.31729 0.0000*** 


(C,T,) 分 别 表示 ADF 检验 模型 中 的 截 距 项 、 趋 势 项 、 灌 后 阶 数 ，*x* 表 示 在 1% 的 置信 水 平 下 显著 


(二 ) TVP-VAR 模型 的 建立 
TVP-VAR 模型 假设 系数 和 误差 项 的 方差 具有 时 变性 ， 满 足 一 阶 随机 游 走 过 程 。 时 变 
性 使 得 模型 能 够 更 好 地 捕捉 投资 者 情绪 以 及 股市 波动 间 可 能 存在 的 、 非 线性 的 、 渐 进 性 
的 联动 变化 或 者 是 结构 性 的 转变 。 然而,， 时 变性 也 使 得 传统 的 似 然 函 数 法 难以 可 靠 地 估 
计 参 数 。Nakajima (2011) 提出 借助 马尔 可 夫 蒙 特 卡 洛 算法 MCMC) 来 克服 传统 估计 法 的 
缺陷 。 首 先 ， 根 据 经 验 设 定时 变 参 数 的 先 验 分 布 ; 其 次 ， 通 过 马尔 可 夫 蒙 特 卡 洛 算法 迭 
代 抽 取 状 态 向 量 的 随机 样本 。 当 满足 相关 条 件 时 ， 马 尔 科 夫 链 的 状态 转移 矩阵 将 收敛 到 
一 个 稳定 的 概率 分 布 ， 选 取 收 敛 后、 满足 平稳 分 布 的 样本 集 即 可 有 效 地 模拟 时 变 参数 的 
条 件 后 验 分 布 ， 进 而 实现 参数 的 统计 推断 。 
根据 六 项 评判 指标 准则 (LogL、LR、FPE、AIC、SC、HQ) 综合 的 结果 ， 判 断 VAR 模 
型 的 最 佳 滞后 阶 数 为 3 阶 。 借 鉴 Nakajima (2011) 和 郑 挺 国 等 〈2018) 的 研究 , 本 文 对 投 
资 者 情绪 (Senti )、 己 实现 波动 率 RV) 以 及 换 手 率 一 阶 差分 序列 《dTurne) 建立 如 
下 时 变 参 数 向 量 自 回 归 〈TVP-VAR) 模型 。 
4yr = Fieye i + Foeyr 2 十 aiyf3 十 2 WU~NCO 7) (1) 


其 中 ，yi 为 3 x 1 维 列 向 量 (Sents, RV, dqTurni) ，Fit、 拉 1:、 己 1 为 3 x 3 维 时 变 系 
数 矩 阵 ， 随 机 扰动 项 s: 为 3 x 1 维 列 向 量 ， 能 反映 结构 冲击 ，Y ,为 以 随机 扰动 项 标准 差 
(oit, ozt ost ) 为 元 素 的 对 角 和 矩阵 。A41 为 对 角 线 元 素 为 1 的 下 三 角 和 矩阵 ， 能 反映 通过 递 
归 识 别 得 到 的 、 由 结构 冲击 带 来 的 、 不 同 变量 间 相 互 影响 的 同时 关系 。 


J 


对 方程 (1) 式 进 行 变形 ， 并 增加 截 距 项 ， 可 以 得 到 方程 的 最 终 形 式 : 
yt= Cet+Biye1t+B2rye2+ Batyr3+er et~N(04r DeAe ') (2) 
其 中 ，Bit = hr1Fi (i = 1,2,3)， 将 Bit 的 元 素 按 行 堆 著 形成 27 x 1 维 的 列 同 量 pi， 
将 4, 非 对 角 线 上 的 下 三 角 元 素 按 行 堆 登 形成 列 向 量 ar 。 er = Az sr ( et~N(0,13)), hr = 


(hat hzt, Past) ， 并 且 满 中 hye = logoit (j = 1,2,3)。 


假设 方程 (2) 式 中 所 有 的 参数 满足 一 阶 随机 游 走 过 程 , 并 且 误 差 项 服从 如 下 分 布 : 


Bir1 = Bt t+ upge, Qt+1 = Qt + Uar, hirs = he t+ Wnt 
Er 1 0 0 0 
u 0 0 0 
pt | ~N|o Sp 
Uat 0 0 为 0 
Upt 0 0 0 Yn 


(Zp)i :~Gamma(20,10%), (Zo)? ~Gamma(4,10%), (Si)i ~Gamma(4,10 4) 


参考 郑 挺 国 〈2018) 的 模型 设 定 ， 假 设 初 始 状态 如 下 : 
Bo~N(npo, 2p0), a o~N(Kao, 2ao)， ho~N(Wno, Zho) 


Hp = Mao = Kno = 0, 2po = Zao = Zn = 10xI 


(三 ) 格 兰 杰 因果 检验 
对 投资 者 情绪 (Sent;)、 已 实现 波动 率 (RV.) 以 及 换 手 率 一 阶 差 分 序列 (dTurni) 
进行 格 兰 杰 因 果 检 验 。 灌 后 阶 数 与 TVP-VAR 模型 一 至 (3 阶 )， 实 验 结果 如 下 : 
表 7 格 兰 杰 因果 检验 表 
原 假 设 F 统计 量 p 值 


Senti 不 是 引起 dTurn4 变 化 的 格 兰 杰 原 因 2. 48165 0. 0603 
dTurni 不 是 引起 Sent, 变 化 的 格 兰 杰 原因 3.14444 0.0250 
RV 不 是 引起 dTurmne 变 化 的 格 兰 杰 原 天 9. 50156 4.E-06 
dTurn 不 是 引起 RV 变化 的 格 兰 杰 原因 1. 16143 0. 3240 
RV 不 是 引起 Sentt 变 化 的 格 兰 杰 原 因 0. 87328 0. 4548 
Senti 不 是 引起 RV 变化 的 格 兰 杰 原因 2. 84445 0. 0373 


检验 结果 表示 ， 在 10% 的 显著 性 水 平 下 ， 拒 绝 “投资 者 情绪 (Sent,) 不 是 引起 换 手 
率 (dTurnz) 变 化 的 格 兰 杰 原因 ”的 原 假设 ;在 5% 的 显著 性 水 平 下 ,拒绝 “ 换 手 率 (dTurn) 
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不 是 引起 投资 者 情绪 (Sentt) 变化 的 格 兰 杰 原因 ”以 及 投资 者 情绪 (Senti) 不 是 引 
己 实 现 波 动 率 (RVL〉 变 化 的 格 兰 杰 原因 ”的 原 假设 ， 在 1% 的 显著 性 水 平 下 ， 拒 绝 “ 
实现 波动 率 〔RVL) 不 是 引起 换 手 率 (dTurnt) 变化 的 格 兰 杰 原因 ”的 原 假 设 。 即 投资 
者 情绪 的 前 期 变化 能 有 效 地 解释 换 手 率 和 波动 率 的 波动 ; 换 手 率 的 前 期 变化 能 有 效 地 解 
释 投资 者 情绪 的 前 期 变化 ;已 实现 波动 率 的 前 期 变化 能 有 效 地 解释 换 手 率 的 波动 。 


[Ul 


(四 ) 实验 结果 分 析 

设 定 马 尔 科 夫 蒙 特 卡 洛 算法 迭代 次 数 为 11000 次 , 舍弃 前 1000 次 的 “ 预 烧 ”抽样 ， 
利用 后 10000 次 满足 平稳 分 布 的 抽样 进行 估计 。 基 于 马尔 科 夫 蒙特 卡 洛 算法 的 TVP-VAR 
模型 估计 结果 如 下 : 


表 6 基于 MCMC 算法 的 TVP-VAR 模型 估计 结果 表 
参数 ”均值 标准 差 95% 置 信 区 间 Geweke 诊断 值 。 ”无 效 影响 因子 
(Zpg)1 0.0023 0.0003 [0.0018,0.0029] 0.864 28.76 
(Zpg)2 0.0023 0.0003 [0.0018,0.0029] 0.928 21.76 
(Za)1 0.0068 0.0021 [0.0038,0.0113] 0.900 99.99 
[ ] 
[ ] 


(En)1 0.0064 0.0028 [0.0033,0.0135 0.204 168.34 
(Zn)2 0.7354 0.0841 [0.5844,0.9123 0.374 45.01 


实验 结果 表明 ， 所 有 估计 的 参数 值 都 落 在 其 95% 置 信 区 间 内 ， 所 有 参数 的 Geweke 
诊断 值 都 未 超过 5% 显 著 性 水 平 的 临界 值 , 即 所 有 参数 估计 的 马尔 科 夫 链 都 是 满足 收敛 性 
的 。 综 上 可 知 ， 参 数 估计 具备 有 效 性 特征 。 


1. 不 同 滞后 期 的 脉冲 响应 分 析 

参考 杨 文 祺 等 〈2020) 和 任 永 平等 (2020) 的 研究 ， 本 文 分 别 选 取 1 天 、7 天 (一 
个 星期 ) 以 及 14 天 《两 个 星期 ) 的 滞后 期 为 代表 来 研究 单位 冲击 变量 对 被 冲击 变量 在 
短期 、 中 期 和 长 期 内 形成 的 影响 。 


(1) 不 同 滞后 期 投资 者 情绪 与 股市 流动 性 间 的 影响 机 制 
在 整个 研究 时 间 段 内 ， 投 资 者 情绪 对 股市 流动 性 指标 的 脉冲 响应 恒 为 正 值 ， 并 存在 
一 定 的 时 变 效 应 。 在 2018 年 6 月 (t=100 附近 ) 至 2019 年 7 月 (t=360 附近 ) 期 间 ， 
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消 后 1 期 的 来 自 投资 者 情绪 变动 的 冲击 对 股市 流动 性 的 影响 缓慢 增加 。 即 当 投 资 者 面 对 
股票 市 场 的 变化 并 经 过 一 段 时 间 确 认 进 入 熊市 (t=20 附近 ) 后 ， 由 于 对 后 市 走势 以 及 持 
续 时 间 的 不 确定 性 以 及 风险 大 恶 的 偏好 ,可 能 会 导致 其 频繁 交易 从 而 使 得 市 场 过 度 反 应 。 
这 样 的 影响 一 直 持 续 至 投资 者 经 过 一 段 时 间 确 认 进 入 牛市 (t=246 附近 )。 

此 外 ， 沸 后 1 期 短期) 的 影响 显著 强 于 浪 后 7 期 和 14 期 (中 长 期 ) 的 影响 。 这 
也 反映 了 股票 市 场 的 信息 效率 ， 与 杨 文 祺 〈2020) 的 研究 结果 一 致 。 反 向 地 ， 虽 然 市 场 
流动 性 指标 对 投资 者 情绪 的 影响 相对 较 小 ， 但 是 其 时 变 效应 更 显 音 〈 受 股市 状态 变化 影 
响 更 强烈 )。 实 验 结果 如 图 4 所 示 。 


Ep et Dp 


0.03 [一 一 一 一 一 I 
0.02 
0.01|、 
-0.01 
100 200 300 400 t( 天 ) 100 200 300 400 t( 天 ) 
滞后 1 期 ”一 一 滞后 7 期 ”一 一 滞后 14 期 


图 4 不同 滞后 期 投资 者 情绪 与 股市 流动 性 间 的 脉冲 响应 图 


(2) 不 同 滞后 期 投资 者 情绪 与 股市 波动 性 间 的 影响 机 制 
实验 结果 如 图 5 所 示 ， 在 研究 时 间 段 内 ， 沸 后 1 期 的 投资 者 情绪 对 股市 波动 率 的 脉 
冲 响 应 恒 为 负 值 ， 且 熊市 时 冲击 更 强烈 ， 中 长 期 的 影响 微弱 。 


cp 十 一 Y 5 X10™ Eco 十 一 


100 200 300 400 t( 天 ) 100 200 300 400 t( 天 ) 
滞后 1 期 ”一 一 滞后 7 期 一 一 滞后 14 期 
图 5 不同 滞后 期 投资 者 情绪 与 股市 波动 性 间 的 脉冲 响应 图 
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2. ”不同 时间 点 的 脉冲 响应 分 析 

本 文 研究 的 时 间 段 内 覆盖 了 一 段 慢 牛市 的 末期 (2018 年 1 月 2 日 至 2018 年 1 月 29 
日 )、 一 段 能 市 (2018 年 1 月 30 日 至 2019 年 1 月 4 日 ) 和 一 段 新 牛 市 的 前 中 期 (2018 
年 1 月 5 日 至 2019 年 12 月 31 日 )。 通 过 选取 2018 年 1 月 15 日 (t=10)、2018 年 7 月 
2 日 (t=120) 以 及 2019 年 6 月 27 日 (t=360) 三 个 时 间 点 可 以 具有 代表 性 地 探究 在 牛 
市 末期 、 熊 市 中 以 及 牛市 前 中 期 单位 冲击 变量 对 被 冲击 变量 影响 的 差异 。 


(1) 不 同时 间 点 投资 者 情绪 与 股市 流动 性 间 的 影响 机 制 

在 三 个 时 间 点 上 ， 投 资 者 情绪 对 股市 流动 性 指标 的 神 击 响应 恒 为 正 值 ， 且 短期 影响 
强 于 长 期 影响 ， 浊 后 3 期 的 情绪 对 股市 流动 性 的 影响 显著 减弱 。 牛 市 时 投资 者 情绪 对 股 
市 流动 性 的 冲击 稍 强 。 实 验 结果 支持 情绪 对 股票 市 场 影响 具有 不 对 称 性 的 认识 。 乐 观 情 
绪 更 容易 推动 股票 价格 向 上 偏离 基本 价值 ， 进 而 容易 导致 频繁 交易 ， 股 价 泡沫 产生 。 反 
向 地 ,市 场 流动 性 指标 对 投资 者 情绪 的 冲击 响应 在 灌 后 2 期 内 为 正 值 ,随后 下 降 为 负 值 ， 
影响 缓慢 减弱 为 0。 可 能 的 传导 机 制 为 : 在 投资 者 观察 到 市 场 交 易 频繁 ， 股 票 换 手 率 提 
高 的 初期 ， 其 情绪 会 容易 随 之 高 涨 并 也 跟随 交易 ， 即 羊 群 效应 。 个 体 的 非 理性 决策 容易 
演变 成 趋同 的 市 场 群体 情绪 和 行动 ， 从 而 造成 频繁 交易 ， 资 产 价格 的 偏离 以 及 市 场 的 波 
动 等 现象 。 然 而 在 投资 者 处 理 信息 做 出 理性 判断 后 ， 股 市 流动 性 变化 的 冲击 即 会 减弱 。 
此 外 ,值得 注意 的 是 ， 能 市 时 市 场 流动 性 变化 对 投资 者 情绪 的 冲击 显著 强烈 于 牛市 。 实 
验 结果 如 图 6 所 示 。 


Ep1T—+ 
0.03 到 0.01 
0.02 | 
0 
0.01 
0 -0.01 SC 
0 5 10 ( 天 ) 0 5 10 ft 天 ) 


2018.1.15(t=10) 一 一 2018.7.2(t=120) 一 一 2019.6.27(t=360) 
图 6 不 同时 间 点 投资 者 情绪 与 股市 流动 性 间 的 脉冲 响应 图 
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(2) 不 同时 间 点 投资 者 情绪 与 股市 波动 性 间 的 影响 机 制 
实验 结果 表明 投资 者 情绪 在 能 市 时 比 在 牛市 时 对 股市 波动 性 指标 的 影响 更 为 强烈 ， 
且 影 响 力 大 小 在 后 5 日 内 经 历 反 复 变 化 后 逐渐 衰弱 。 这 可 能 与 投资 者 接受 并 处 理 信息 的 
能 力 以 及 信息 传播 的 效率 有 关 。 


x103 su 人 一 p 
< 


-10-- 一 
0 5 10 t 天 ) 0 5 ”10 t( 天 ) 
2018.1.15(t=10) 一 一 2018.7.2(t=120) 一 一 2019.6.27(t=360) 
图 7 不同 时间 点 投资 者 情绪 与 股市 波动 性 间 的 脉冲 响应 图 
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五 、 结论 与 建议 

本 文 就 投资 者 情绪 对 股市 的 影响 做 出 研究 , 提出 使 用 深度 学 习 的 方法 研究 大 量 的 市 
场 情绪 ， 基 于 东方 财富 网 和 深 证 成 指 的 数据 ， 使 用 BERT 模型 构建 投资 者 情绪 ， 同 时 引 
入 市 场 流动 性 、 市 场 波动 性 指标 。 实 验 结果 显示 相关 性 较 高 ， 说 明 投资 者 情绪 确实 对 股 
票 市 场 有 较 大 影响 。 剩 余 的 结果 侦 离 可 能 是 由 于 实证 分 析 中 数据 疏 取 不 完善 、 股 吧 数 据 
噪声 较 大 、 分 析 模 型 有 微小 偏差 引起 的 。 但 在 大 的 方面 符合 假设 ， 实 验 结果 也 说 明了 该 
模型 具有 较 强 的 稳健 性 。 

本 文 的 研究 结论 包括 : 1) BERT 模型 能 有 效 地 挖掘 出 股吧 中 的 投资 者 情绪 。 2) 
TVP-VAR 模型 能 够 有 效 搭建 投资 者 情绪 、 流 动 性 和 波动 性 三 者 之 间 的 关系 。 

基于 本 次 研究 的 政策 建议 有 : 1) 中 国 股票 市 场 投 资 者 情绪 对 股市 影响 较 大 ， 尤 其 
是 个 人 投资 者 情绪 容易 受到 股吧 等 社交 平台 情绪 的 影响 , 这 对 进一步 完善 国家 市 场 经 济 
制度 做 出 要 求 。 随 着 股票 市 场 的 完善 ， 机 构 投资 者 的 增多 ， 股 价 对 投资 者 情绪 的 敏感 度 
会 降低 ， 市 场 风 险 也 将 降低 。2) 把 发 展 机 构 投资 者 作为 我 国 证 券 市 场 重要 发 展 战略 的 
同时 , 如 何 提高 机 构 投资 者 的 素质 、 增 强 其 投资 行为 的 理性 化 程度 也 是 一 个 同等 重要 的 
问题 。 这 一 问题 解决 得 好 , 才能 提高 个 体 投资 者 素质 ,进而 提高 市 场 效率 。 

本 文 存 在 着 一 些 未 完善 之 处 有 待 学 者 进一步 研究 。 例 如 : 未 来 的 工作 可 以 尝试 研究 
国家 政策 、 市 场 、 突 发 事件 等 不 确定 性 因素 影响 ， 也 可 以 在 模型 中 加 入 更 多 解释 变量 减 
少 噪声 ， 演 试 使 用 长 周期 样本 以 及 更 小 的 样本 来 进一步 试验 完善 模型 和 参数 ， 提 高 模型 
的 性 能 。 
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